home *** CD-ROM | disk | FTP | other *** search
/ Cream of the Crop 20 / Cream of the Crop 20 (Terry Blount) (1996).iso / os2 / unh204.zip / UNH204.TXT < prev   
Text File  |  1996-06-25  |  3KB  |  64 lines

  1. OS/2 Upload Information Template for ftp-os2.nmsu.edu
  2.  
  3. Archive Name: UNH204.ZIP
  4. Program Description: a command line utility to strip HTML codes
  5. Operating System Versions: OS/2 2.x and later
  6. Program Source: Don Hawkinson, author
  7. Replaces: UNH202.ZIP UNH175.ZIP UNH150.ZIP 
  8.           NOTE: UNHTMLxx.zip is a different utility
  9.  
  10. Your name: Don Hawkinson
  11. Your email address: dwhawk@southwind.net 
  12.  
  13. Proposed directory for placement:  ./os2/textutil
  14.  
  15. This is an OS/2 command line utility to strip HTML codes from
  16. files saved from the WebX or other web browsers. 
  17.  
  18. UNH 2.04  HTML stripper by Don Hawkinson  dwhawk@southwind.net
  19.  
  20. usage:  ..\unh  file1 file2 <file3>
  21.  
  22.     file1 == html file
  23.     file2 == stripped text output file
  24.     file3 == URLs from html source file - optional
  25.  
  26.  
  27. UNH does not check for the existance of the output
  28. file, and will overwrite any existing file.  UNH
  29. is HPFS aware.
  30.  
  31. UNH does not attempt to recreate the format of the  Web page. UNH does
  32. not attempt to force any format on the output text, nor does it attempt
  33. to remove any existing text format. While the layout of tables and lists
  34. is lost during stripping, data is sorted to separate lines for
  35. legibility.
  36.  
  37. The HTML specification defines Character Entity Sets or tags to
  38. represent particular graphic characters which have special meanings
  39. in places in the markup, or may not be part of the character set
  40. available to the writer. UNH does not attempt to scan for all of the
  41. possible tags, but does try to resolve the most common tags.
  42.  
  43. This version of UNH has support for codepages 437 and 850 and if
  44. codepage 850 is in use, the 850 character set is used. The codepages
  45. only make a difference when &xxxx; or &#nnn; tags are present in the
  46. file. If the correct character or an acceptable alternate is not
  47. &#nnn; available a space will be used. If an unrecognized tag is
  48. encountered, it is left in the output text.
  49.  
  50. This version should be useable under OS/2 2.1, but it has not been
  51. tested.  The special compression option for OS/2 Warp was not used
  52. when linking the executable.
  53.  
  54. This program is free, but the author retains all rights. See the file
  55. license.txt file for further information.
  56.  
  57. The command line utility UNH.EXE uses the same logic as the shareware
  58. PMStripper to strip the HTML codes from files. PMStripper is a PM
  59. utility that loads the stripped file into a MLE window to allow
  60. simple editing functions.  PMStripper is distributed as PMS_xxx.ZIP
  61. with the version number replacing the xxx.  For information on the 
  62. current PMStripper version, contact send email to dwhawk@southwind.net .
  63.                                                           
  64.